package com.wsh.crawler.service;

import com.wsh.crawler.constant.NewsSourceEnum;
import com.wsh.crawler.entity.News;

public interface CrawlerService {
    /**
     * 执行指定爬取某个源的爬虫任务
     * */
    void crawlNews(NewsSourceEnum source);

    /**
     * 执行所有源的爬虫任务（需在CrawlerServiceImpl静态代码块里初始化的）
     * */
    void crawlAllSources();

    /**
     * 指定某个url和源任务，解析文章详情页（含持久化操作）
     * */
    News crawlSingleArticle(String url, String sourceName);
}